時間序列(time series)是一系列有序的數據。通常是等時間間隔的采樣數據。如果不是等間隔,則一般會標注每個數據點的時間刻度。 time series data mining 主要包括deco ...
時間序列(time series)是一系列有序的數據。通常是等時間間隔的采樣數據。如果不是等間隔,則一般會標注每個數據點的時間刻度。 time series data mining 主要包括deco ...
1.介紹 有三種不同的方法來評估一個模型的預測質量: estimator的score方法:sklearn中的estimator都具有一個score方法,它提供了一個缺省的評估法則來解決問題。 ...
Reference: http://mp.weixin.qq.com/s?src=3×tamp=1474979163&ver=1&signature=wnZn1UtW ...
1) 最大似然估計 MLE 給定一堆數據,假如我們知道它是從某一種分布中隨機取出來的,可是我們並不知道這個分布具體的參,即“模型已定,參數未知”。例如,我們知道這個分布是正態分布,但是不知道均值和方 ...
自組織映射神經網絡, 即Self Organizing Maps (SOM), 可以對數據進行無監督學習聚類。它的思想很簡單,本質上是一種只有輸入層--隱藏層的神經網絡。隱藏層中的一個節點代表一個需要 ...
Computational Network Toolkit (CNTK) 是微軟出品的開源深度學習工具包。本文介紹CNTK的基本內容,如何寫CNTK的網絡定義語言,以及跑通一個簡單的例子。 根據微 ...
http://www.cnblogs.com/tornadomeet/p/3300132.html 沒有系統學過數學優化,但是機器學習中又常用到這些工具和技巧,機器學習中最常見的優化當屬凸優 ...
原創博客,未經允許,不得轉載。 生存分析,survival analysis,顧名思義是用來研究個體的存活概率與時間的關系。例如研究病人感染了病毒后,多長時間會死亡;工作的機器多長時間會發生崩潰等。 ...
word2vec 是google 推出的做詞嵌入(word embedding)的開源工具。 簡單的說,它在給定的語料庫上訓練一個模型,然后會輸出所有出現在語料庫上的單詞的向量表示,這個向量稱為"wo ...
原創博客,轉載請注明出處 Leavingseason http://www.cnblogs.com/sylvanas2012/p/5053798.html EM框架是一種求解最大似然概率估計的方 ...